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基于 RPYS i/o 的 数字 图 书馆 领域 /历史 根源 文献 探究， 
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摘要 : [目的 /意义 ] 探 索 茶 一 学 科 或 研究 领域 的 历史 根源 与 演化 问题 ,对 其 建设 与 发 展 具有 重要 意义 。[ 方 
法 /过 程 ] 基 于 可 视 化 在 线 工具 RPYS i/o 进行 标准 RPYS( 参考 文献 出 版 年 图 谱 ) 与 多 维 RPYS 两 种 分 析 , 发 现 对 数 
字 图 书馆 领域 的 起 源 和 演化 起 到 重要 影响 的 文献 。[ 结果 /结论 ] 该 工具 提供 的 标准 RPYS 分 析 能 够 较 准 确 的 发 现 
该 领域 起 源 相 关 的 经 典 文献 ,并 通过 多 维 RPYS 分 析 还 可 以 发 现在 该 研究 领域 起 源 过 程 中 起 到 持久 贡献 的 文献 。 
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Lesk 从 技术 经济 法 律 及 社会 等 角度 回顾 了 数字 图 书 
CORE Capp 20 世纪 90 年 代 1993 。 馆 的 发 展 历史 及 面临 的 问题 ”,X，Tis 将 数字 图 书包 
OSAERA Ea A (National Scene Fonda 的 发 展演 化 过 程 划分 为 4 个 阶段 :GD1990 年 以 前 的 
PP. - HL] AU EE HI; (21991 - 2000 年 成 长 期 ;@@2000 - 
ub NS) .美国 国防 部 尖端 研究 项 目 机 构 ( Defense M BM ms 
Advanced Research Projects Agency , DARPA) .国家 航空 PE TEET M Rd PA 
Hs E (National Aeronautics and Space Administra- 大 型 数字 图 书馆 的 建设 时 期 ”。 以 上 研究 对 了 解数 
JSuasoEemiEECEmHGMEOM IE Du L. 78 SUUS RURNUESCRGESIT — EIL E 
bk Initiative ,DLI) 。1994 年 ,美国 国会 图 书馆 宣布 烽 。 用 "但 上 述 研究 在 进行 数字 图 书信 领域 综述 研究 时 ， 
H*c rmm 美国 的 这 一 行动 推动 了 世 。“ 雹 采用 人 工 阅 读 的 系统 综述 方式 ,效率 低 , 且 容易 带 
和 区 围 内 数字 图 书馆 的 建设 。 数 字 图 书馆 前 期 也 被 称 。 有 主观 性 ,难以 应 对 海量 的 学 术 资 源 。 国 内 外 还 有 
SETARE .虚拟 图 书馆 .但 是 关于 数字 图 书馆 的 慨 。 利用 共 词 共 引 的 文献 计量 学 方法 ,如 杨 国 立 中 、 间 
念 己 直 没 有 统一 的 说 法 ,数字 图 书馆 发 展 20 余 载 ,不 WET \ 杨 九龙 RET T L. Godea “等 人 均 采 
仅 够 图 书馆 带 来 了 技术 层面 的 改变 ,更 是 服务 观念 与 日 了 该 方法 对 数字 图 书馆 领域 的 研究 现状 与 热点 进 
方式 的 巨大 变革 , 随 着 计算 机 技术 与 现代 通讯 技术 的 。 行 了 分 析 , 而 对 于 该 领域 产生 之 前 的 文献 即 起 源 问 
发 展 ,数字 图 书馆 将 成 为 越 来 越 复杂 的 研究 领域 ,也 将 。 题 并 未 具体 研究 。 
面临 更 多 的 问题 ,因此 有 必要 对 数字 图 书馆 领域 进行 基于 以 上 原因 ,本 文 利用 新 兴 的 文献 计量 分 析 工 
综述 研究 , 理 清 数字 图 书馆 领域 起 源 及 演化 发 展 过程 ， 具 RPYS io, 来 探究 数字 图 书馆 领域 的 历史 根源 及 演 
对 于 数字 图 书馆 研究 的 进一步 发 展 具有 重要 意义 。 化 过 程 ,从 海量 文献 中 发 现 可 能 与 该 领域 起 源 相关 的 
基于 数字 图 书馆 及 相关 领域 文献 的 调研 ,发 现 国 。 ”的 经 典 文献 ,对 于 明确 数字 图 书馆 的 概念 内 涵 以 及 该 
内 外 有 文献 研究 了 该 领域 的 起 源 及 发 展 过 程 ,如 邓 香 “领域 进一步 建设 与 发 展 具有 重要 意义 ,以 期 为 其 他 研 
莲 从 电子 图 书馆 与 数字 图 书馆 的 关系 人手 ,阐述 了 数 。” 究 者 使 用 该 工具 寻求 其 他 研究 领域 的 历史 根源 文献 提 
字 图 书馆 的 起 源 ,并 分 析 归 纳 了 其 概念 内 涵 ""; M， ” 供 借鉴。 
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2 RPYSi/o 的 原理 及 功能 特点 


1964 年 ,在 美国 空军 科学 研究 办 公 室 (AFOSR ) 的 

资助 下 ,E. Garfield |I. H. SHER 和 R .J.TORPIE 讨论 了 
利用 引文 数据 来 探索 科学 领域 历史 根源 的 模型 与 方 
i; ,2003 4E, E. Garfield , A. I. PUDOVKIN 和 V. S. IS- 
TOMIN 基于 引文 分 析 开 发 了 引文 图 谱 分 析 软 件 
HistCite ,可 以 快速 描绘 一 个 学 科 领 域 的 发 展 历 史 , 定 
位 该 领域 的 重要 文献 ” ,2013 年 ,在 第 十 四 届 国 际 科 
学 计量 学 和 信息 计量 学 大 会 (14th International Confer- 
ence on Scientometrics & In-formatries , ISSI 2013) E,W. 
Marx FI L. Bornmann 首次 提出 了 “参考 文献 出 版 年 图 
谱 ”( Reference Publication Year Spectroscopy , RPYS) 这 
一 堂 科 领域 历史 根源 探究 的 新 方法 "… ,国内 研究 者 李 
IEF RPYS 总 结 为 “以 某 一 个 领域 的 全 部 文献 所 引用 
的 全 部 参考 文献 的 出 版 年 份 (RPYs ) 为 横 轴 , 以 每 个 参 
ASWH CAE ( RPY ) 的 全 部 参考 文献 的 总 被 引 频 次 为 
引 负 而 形成 的 二 维 分 布 图 "5 ,RPYS 在 算法 和 可 视 化 
方面 可 以 作为 HistCite 方法 的 补充 。 
加 当前 RPYS 分 析 研 究 者 已 经 开发 出 两 种 软件 包 : 
Qf2Q14 年 ,由 荷兰 阿姆斯特丹 大 学 L. Leydesdodtf 开发 
的 RPYS. exe, 并 免费 提供 给 广大 研究 者 使 用 ,其 获取 
网 六 是 http :// www. leydesdorff. net/software/rpys/., (2) 
由 药 比 锡 电 信和 应 用 科技 大 学 A. Thor 开发 的 CREx- 
phexe ,其 软件 免费 获取 网 址 是 http://andreas -thor. 
si io/cre/, CRExplor. exe 相 比 于 RPYS. exe 多 了 
"dg" 消 歧 ” 功 能 ,能 够 识别 被 引用 的 参考 文献 的 一 些 
变 博 , 即 整合 由 于 写法 不 规范 而 事实 上 是 同一 参考 文 
献 的 一 些 数据 。 

RPYS i/o 是 2016 年 由 美国 弗吉尼亚 技术 应 用 研 
究 公 司 (VTARC)J. A. Comins 与 荷兰 阿姆斯特丹 大 学 
L. Leydesdorff 共同 开发 的 在 线 工 具 , 可 以 进行 两 种 
RPYS Zr ^: .QO 标准 RPYS( Standard RPYS) 分 析 。 标 
准 RPYS 的 原理 是 从 参考 文献 角度 出 发 ,认为 在 研究 
领域 产生 前 发 表 的 全 部 参考 文献 中 ,总 存在 着 几 篇 文 
献 的 被 引 频 次 远 高 于 同年 或 前 后 几 年 发 表 的 其 他 文 
献 , 这 些 文献 很 可 能 就 是 对 学 科 领 域 的 起 源 及 演化 发 
挥 重 要 作用 的 经 典 文献 ,而 这 些 文献 一 定位 于 图 谱 的 
峰值 点 上 ,因此 ,通过 对 参考 文献 出 版 年 图 谱 在 学 科 领 
域 产生 之 前 的 引用 频次 的 峰值 进行 分 析 , 来 探索 该 学 
科 领 域 的 历史 根源 文献 。@ 四 多 维 RPYS (Multi -RPYS) 
分 析 。 多 维 RPYS 分 析 的 原理 是 将 每 年 的 参考 文献 进 
行 一 次 标准 RPYS 分 析 , 即 算出 参考 文献 的 每 年 总 被 
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引 频 次 相对 于 前 一 年 .前 两 年 、 该 被 引用 年 .后 一 年 .后 
两 年 的 总 被 引 频 次 的 中 位 数 的 偏差 ,再 利用 秩 转换 的 
思想 ,将 偏差 数值 进行 排序 ,偏差 越 大 则 秩 的 值 越 高 ， 
再 将 秩 值 转化 为 可 视 化 的 热度 值 图 谱 ,热度 值 越 大 , 颜 
色 越 深 。 因 此 ,热度 值 图 谱 的 颜色 越 深 ,代表 偏差 值 越 
大 ,进而 表明 该 RPY 的 被 引 频 次 相 比 与 前 后 几 年 被 引 
越 频 繁 。 多 维 RPYS 分 析 图 谱 可 以 表示 每 一 年 的 参考 
文献 逐年 的 引用 热度 及 动态 变化 情况 , 借 此 可 以 一 定 
程度 上 分 析出 历史 上 对 该 学 科 或 研究 领域 具有 长 期 贡 
献 的 参考 文献 。 

RPYS i/o 与 分 析 软 件 RPYS. exe 和 CRExplor. exe 
的 区 别 在 于 :中 基于 网 络 在 线 平 台 ,操作 简单 ,交互 性 
好 ;@ 可 以 进行 标准 RPYS 与 多 维 RPYS 两 种 分 析 ;3) 
基于 DOI 和 Google 搜索 引擎 ,提供 了 获取 所 识别 的 学 
科 或 研究 领域 的 经 典 文献 的 链接 。 而 在 线 工具 RPYS 
i/o 最 大 的 局 限 是 当前 版 本 仅 能 够 分 析 大 小 15M. 以 内 
的 数据 集 , 且 当前 版 本 可 分 析 的 出 版 年 限 范围 是 1900 
-1999 年 。 但 相 比 于 已 有 分 析 软 件 ,该 在 线 工 具 能 够 
进行 多 维 RPYS 分 析 是 其 最 大 的 优势 ,此 外 能 够 提供 
获取 经 典 文献 的 DOI 也 是 该 工具 的 特色 。 

关于 RPYS 的 应 用 效果 ,国外 已 有 10 余 篇 利用 
RPYS. exe 或 CRExplor. exe 软件 来 探究 某 领 域 的 历史 
根源 的 研究 ,涉及 希 格 斯 波 色 子 “石墨 烯 与 太阳 能 
电池 ”生物 学 中 的 “达尔 文 省 传奇 """ 、 全 球 定位 系 
Ht 及 气候 变化 ”等 各 个 领域 ,国内 李 信 、 陆 伟 、 李 旭 
晖 2016 年 首次 利用 RPYS 对 健康 信息 素养 领域 的 历 
史 起 源 问题 进行 了 研究 ,2017 年 ,以 引文 分 析 "” 和 
情感 分 析 为 例 ” ,进一步 探索 了 RPYS 分 析 作 用 。 上 
述 研究 表明 RPYS 在 一 定 程 度 上 揭示 一 个 学 科 或 研究 
领域 的 影响 深远 的 重要 文献 ,发 现 甚至 成 为 无 人 问津 
的 “ 睡 美人 文献 ”。 关 于 利用 RPYS i/o 在 线 工具 来 探 
究 历 史 根源 的 文献 ,国外 只 有 少数 几 篇 , 即 开发 者 曾 对 
生物 医学 的 基底 细胞 癌 领 域 ” 和 期 刊 《journal Philoso- 
phy of Science) ^ 的 根源 和 经 典 文献 进行 了 探究 ,大 连 
大 学 侯 建华 老师 也 利用 该 工具 对 引文 分 析 领 域 的 起 源 
问题 进行 了 研究 ,国内 中 文 文献 还 未 见报 道 。 


3 ”数字 图 书馆 领域 历史 根源 文献 探究 
3.1 数据 来 源 
笔者 选择 Web Of Science( WOS) 核心 合集 作为 数 
据 来 源 ,具体 包括 以 下 索引 :SCI-EXPANDED SSCI, 
A&HCI,CPCI.S 及 CPCI-SSH; 检 索 策略 为 :主题 =“e- 


lectronic libra * " 


or "digital libra * " or "virtual libra 


d 


XA, 谢 福 郁 , 王 春 
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, 等 . 基于 RPYS io 的 数字 图 书馆 领域 历史 根源 文献 探究 [J. 图 书 情报 工作 ,2018 ,62(5) :87 - 96. 


* ”; 时 间 跨 度 为 1985 年 至 今 ,检索 时 间 为 2017 年 8 
月 31 日 ;文献 类 型 选择 article ,精炼 后 得 到 与 数字 图 书 
馆 相 关 的 论文 3 621 篇 ,选择 “全 记录 和 引用 的 参考 文 
献 ” 导 出 格式 ,一 次 最 多 导出 500 条 ,再 将 导出 的 数 个 txt 
文件 合并 成 一 个 数据 文件 ,将 其 重 命名 为 data. txt, 作 为 
本 研究 最 终 分 析 的 数据 文件 。 该 数据 集 大 小 为 13M。 
3.2 导入 数据 

RPYS i/o 平台 网 址 是 http://comins. leydesdorff. 
net/ ,界面 见 图 1 ,推荐 采用 Google Crome 或 Safari 浏览 

AS, ENI A gy (AUN Firefox) 则 不 太 适 合 运 行 该 工具 ， 
将 数据 文件 data. txt 上 传 至 该 平台 即 可 进行 在 线 分 析 , 需 
要 注意 的 是 该 分 析 工 具 要 求 的 数据 集 大 小 是 15M 以 内 。 
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3.3 ”标准 RPYS 运行 结果 解读 

运行 结果 上 方 展示 的 是 1900 - 1999 年 数字 图 书 
馆 领 域 标准 参考 文献 出 版 年 图 谱 ( 见 图 2) ,该 图 谱 x 
轴 表 示 的 是 参考 文献 出 版 年 ,y 轴 呈 现 了 两 组 数据 值 ， 
柱状 图 表示 的 是 每 一 年 参考 文献 的 被 引 总 频次 , 样 条 
光滑 曲线 表示 的 是 该 出 版 年 的 参考 文献 的 总 被 引 频 次 
相对 于 该 出 版 年 前 一 年 .前 两 年 .该 出 版 年 .后 一 年 .后 
两 年 的 总 被 引 频次 的 中 位 数 的 偏差 。 鼠 标 滑 过 每 一 出 
版 年 ,网 页 上 会 自动 显示 该 年 参考 文献 的 总 被 引 频 次 
及 与 偏差 的 具体 数值 。 例 如 1981 - 1985 年 参考 文献 
的 总 被 引 频 次 依次 为 295 ,301 ,470 .380 ,433 ,可见 这 5 
年 中 位 数 为 380 ,1983 年 总 被 引 频次 470 与 该 中 位 数 
的 偏差 为 90 ,1983 年 在 样 条 光滑 曲线 上 呈现 出 峰值 的 
数值 即 90。 在 图 谱 区 域 点 击 并 拖 动 鼠标 ,可 以 呈现 所 
选择 的 年 限 范围 的 参考 文献 出 版 年 图 谱 , 更 清晰 地 展 
示 特 定年 限 范围 内 曲线 及 柱 形 图 的 变化 情况 ,例如 
1900 - 1944 年 曲线 波动 不 明显 , 若 以 1900 年 为 起 点 拖 
动 鼠 标 至 1944 年 ,平台 则 重新 更 加 清晰 的 呈现 1900 — 
1945 年 限 范围 内 的 图 谱 ( 见 图 3) , 若 以 1946 年 为 起 点 
拖 动 鼠标 至 1960 年 , 则 也 更 清晰 的 呈现 该 时 间 段 内 的 
峰值 情况 ( 见 图 4) 。 
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图 3 1900 —1944 年 数字 图 书馆 领域 标准 参考 文献 出 版 年 图 谱 
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Standard RPYS 


Source: Web of Science 


-9- Difference from Median 


Raw Frequency (cited references) 


1950 
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o 
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Reference Publication Year 


图 4 1946 -1960 年 数字 图 书馆 领域 标准 参考 文献 出 版 年 图 谱 


返回 的 运行 结果 页 面 下 方 呈现 的 是 可 供 检索 的 文 
献 列 表 ( 见 图 5) ,数据 内 容 是 所 检索 年 份 的 参考 文献 
按 被 引 频 次 排名 前 40 的 文献 ,该 列表 包括 5 列 内 容 : 
第 二 列 为 文献 作者 ;第 二 列 为 文献 的 出 版 年 ;第 三 列 为 
该 美 献 的 来 源 出 版 物 ;第 四 列 为 该 文献 的 总 被 引 频次 ; 
第 下 列 为 获取 该 文献 的 链接 。 该 文献 列表 可 以 帮助 使 
用 着 寻找 到 该 研究 领域 的 重要 历史 根源 文献 ,如 1983 
鲈 是 现 出 一 个 明显 的 峰值 ,说 明 该 年 的 参考 文献 被 引 
用 鼎 繁 ,该 年 发 表 的 研究 成 果 对 数字 图 书馆 领域 的 研 
究 易 响 重 大 ,引用 频次 最 高 的 文献 对 该 领域 的 起 源 或 
物 展 起 到 重要 作用 ,在 检索 框 中 输入 rpy1983 ,数据 列 

E 约 出 了 出 版 年 1983 年 引用 频次 排名 前 40 的 文献 ， 
Dno Time Referenced ,可 以 按照 被 引 频 次 从 高 到 低 或 


从 独到 高 排序 。 

E uM 

» «d Search and Refine Results: rpy1983 

IN 
Aut ) RPY Source Times Referencec 
M. RPY1983 INTRO MODERN INFORMA 37 
SALTON G. RPY1983 INTRO MODERN INFORM 13 
CARD'S. RPY1983 PSYCHOL HUMAN COMPUT 8 
TUFTE E. RPY1983 VISUAL DISPLAY QUANT 8 
DIMAGGIO PJ RPY1983 AM SOCIOL REV V48 P147 7 
SALTON G RPY1983 COMMUN ACM V26 P1022 7 
ZADEH LA RPY1983 COMPUT MATH APPL V9 P149 5 
JORGENSEN WL RPY1983 J CHEM PHYS V79 P926 5 
CULNAN M. J. RPY1983 DECISION SCI V14 P194 4 
GOLDBERG A. RPY1983 SMALLTALK 80 LANGUAG 4 
KABSCH W RPY1983  BIOPOLYMERS V22 P2577 4 
ANDERSON JR RPY1983  JVERB LEARN VERB BE V22 P261 4 


S 所 检索 年 份 的 参考 文献 按 被 引 频 次 排名 前 40 的 文献 


3.4 标准 RPYS 结果 分 析 

基于 上 述 图 谱 结果 ,对 数字 图 书馆 领域 的 起 源 与 
演化 起 重要 作用 的 文献 进行 分 析 , 从 图 2 可 以 看 出 ， 
1900 - 1960 年 该 领域 参考 文献 年 被 引 总 频次 整体 较 低 
(IRF 100 次 ) ,1961 - 1985 年 该 领域 的 参考 文献 被 引 
总 频次 稳步 提升 (从 100 次 左右 上 升 至 400 余 次 ) ,从 
1986 年 起 该 领域 参考 文献 被 引 总 频次 一 度 呈 指数 型 
增长 (600 余 次 增加 至 4 000 余 次 ) ,表明 数字 图 书馆 领 
域 进 入 了 快速 发 展 时 期 。 基 于 上 述 观察 结果 ,本 研究 
将 数字 图 书馆 领域 产生 前 RPY 划分 为 1900 - 1960 年 、 
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1961 - 1985 年 和 1986 - 1993 年 3 个 时 间 段 ,依据 W. 
Marx 等 2014 年 的 研究 成 果 " ,在 对 RYYS 峰值 点 分 
析 时 ,往往 只 需要 对 被 引 频 次 最 高 的 单 篇 文献 进行 分 
析 , 即 通过 被 引 频 次 最 高 的 文献 来 探究 对 该 学 科 或 领 
域 的 起 源 的 重要 作用 ,根据 上 述 RPYS 分 析 的 原理 , 观 
察 总 被 引 频次 与 5 年 总 被 引 频次 中 位 数 偏差 曲线 的 峰 
值 点 年 份 , 结 合 文献 列表 检索 出 该 RPY 被 引 频 次 最 高 
的 文献 ,并 进行 分 析 。 

3.4.1 1900 - 1960 年 数字 图 书馆 领域 标准 RPYS 分 
析 从 图 2 可 知 ,1900 - 1960 年 间 ,数字 图 书馆 领域 
RPYS 上 出 现 了 一 个 最 大 的 峰值 点 :1945 年 ,结合 图 3 
和 图 4 ,该 时 间 段 内 也 存在 一 些 相 对 较为 明显 的 峰值 
点 :1913 年 .1926 年 .1938 年 .1956 年 和 1960 年 ,利用 
文献 列表 检索 出 上 述 6 个 峰值 点 被 引 频 次 最 高 的 文 
献 , 见 表 1 。 

由 表 1 可 见 ,最 大 的 峰值 点 处 
(1945 年 ) 被 引 频 次 最 多 的 参考 文献 
是 美国 科学 家 V. Bush HJEK. 布 
fF) f£ (The Atlantic Monthly》(《 大 西 
洋 月 刊 》) 上 发 表 的 一 篇 文章 “As we 
may think" ^" ,东北 师范 大 学 传媒 科 
学 学 院 徐 跃 权 教授 将 其 翻译 为 “我 们 
可 以 这 样 设想 ” ,该 文 详细 的 描绘 
了 计算 机 技术 对 于 科研 者 在 信息 收 
集 、 存 储 、 发 现 和 检索 方面 的 应 用 前 景 。 文 中 6 次 提 到 
图 书馆 ,对 图 书馆 机 械 化 充满 了 们 慢 ,布什 提出 了 一 个 
全 新 的 概念 “Memex( 记忆 扩展 机 )”, 将 所 有 资料 存 于 
此 ,一 个 屏幕 一 个 键盘 一 系列 按钮 和 手柄 即 可 自由 
阅读 。 

1913 年 峰值 点 处 是 提出 “记忆 遗忘 曲线 ”的 德国 
著名 心理 学 家 H. Ebbinghaus 的 论文 “1 ,该 文 阐述 了 练 
习 对 记忆 力 的 影响 研究 ;1926 年 峰值 点 处 是 A. J. Lotka 
提出 的 “ 洛 特 卡 定律 ”一文 ” , 洛 特 卡 定律 是 文献 计量 


Link 


H 


d 


ABA, 


, F. 基于 RPYS io 的 数字 图 书馆 领域 历史 根源 文献 探究 [可 .图 书 情 报 工作 ,2018 ,62(5) :87 - 96. 


表 1 1900 -1960 年 峰值 点 被 引 频 次 最 多 的 参考 文献 


RPY ”RPY 被 引 总 频次 


被 引 频次 最 高 的 参考 文献 /被 引 频 次 


1913 10 
1926 11 

(12) :317 -323.75 
1938 16 
1945 321 
1956 40 
1960 66 


学 中 的 重要 定律 ,第 一 次 揭示 了 作者 频率 与 文献 数量 
之 间 的 关系 ;1938 年 峰值 点 处 是 H. G. Wells 的 著作 
《World brain) ^" ,该 文献 提出 "世界 脑 ” 的 概念 , 当 作 
知识 的 联合 系统 ,所 有 人 都 可 以 访问 ;1956 年 峰值 点 
处 是 G.A. Miller 闻名 世界 的 一 篇 论文 , 即 “ 神 奇 的 数 
字 7+2”” ,该 文 指出 人 的 记忆 是 短 时 的 ,人 类 信息 加 
能力 存在 局 限 ;1960 年 峰值 点 处 的 论文 是 本 Cohen 


RPY 被 引 总 频次 


EBBINGHAUS H. Memory:a contribution to experimental psychology[ M ]. Boston :University ,1913. /2 


LOTKA ALFRED J. The frequency distribution of scientific productivity [ J ] . Journal of the washington academy of sciences , 1926 ,16 


WELLS H G. World brain| M ]. First UK edition. London ; Methuen & Co. , 1938. /3 
BUSH V. As we may think[ J]. The atlantic monthly ,1945 ,176(1) :101 -108. /26 
MILLER G A. The magical number seven[ J ]. Psychological review 1956 ,63(2) :81 -97. /10 


COHEN J. A coefficient of agreement for nominal scales[ J ]. Educational & psychological measurement, 1960 ,20 ( 1) :37 — 46. /16 


等 提出 的 统计 学 指标 * kappa RAU O ,该 系数 作为 评 
价 判断 一 致 性 程度 的 指标 ,在 许多 研究 中 被 广 为 应 用 。 
3.4.2 1961 - 1985 年 数字 图 书馆 领域 标准 RPYS 分 
析 笔者 用 同样 方法 观察 图 2, 可 见 1961 - 1985 年 间 
^H 6 个 较为 明显 的 峰值 点 ,分 别 为 :1965 年 .1967 年 、 
1973 年 .1975 年 .1979 年 和 1983 年 。 结 合 文献 列表 检 
索 到 上 述 RPY 被 引 最 高 频次 的 文献 ,如 表 2 所 示 : 


R2 1961-1985 年 峰值 点 被 引 频 次 最 多 的 参考 文献 


被 引 频 次 最 高 的 参考 文献 /被 引 频 次 


六 时 间 阶 段 内 第 一 个 峰值 点 被 引 频 次 最 高 的 参考 
文献 是 D. J. D. PRICE ( 3£ 4i Hr) 1965 年 发 表 在 《Sci- 
enge) j PI 中 的 “Networks of scientific papers" — X: , 
普 赖 斯 是 美国 著名 科学 学 家 、 科 学 史家 ,情报 科学 的 创 
始 人 之 一 ,科学 计量 学 之 父 。 这 篇 论文 是 普 赖 斯 发 表 
论文 中 最 著名 的 一 篇 ,他 利用 SCI 的 引文 数据 ,展示 了 
科学 论文 之 间 的 引证 关系 、 引 证 网 络 以 及 这 种 关系 和 
网 络 可 以 如 何 用 来 进行 科学 计量 学 的 研究 ;第 二 峰值 
点 文献 是 B. G. Glaser 和 A. L. Strauss 于 1967 年 共同 
提出 了 一 种 定性 研究 方法 “扎根 理论 "一 文 ” ,扎根 理 
论 的 首要 任务 是 建立 介 于 宏大 理论 和 微观 操作 性 假设 
之 间 的 实质 理论 ( 即 适 用 于 特定 时 空 的 理论 ) ,但 也 不 
排除 对 具有 普 适 性 的 形式 理论 的 建构 ,该 理论 在 图 书 
情报 领域 也 被 广 为 应 用 , 如 王 平 ”、 林 婷 ”、 茹 嘉 
禄 ”等 基于 扎根 理论 对 图 书馆 服务 与 管理 进行 了 探 
讨 ; 第 三 峰值 点 文献 是 美国 的 H. Small 于 1973 年 提出 
了 共 引 分 析 的 概念 一 文 ” ,引文 分 析 中 最 具 影响 力 的 
就 是 共 引 分 析 方 法 ,用 于 揭示 科学 研究 现状 、 演 化 及 前 


Information Science ,1973 ,24(4) :265 -269./18 


99 PRICE D J D. Networks of scientific papers[ J ]. Science,1965 ,149(3683 ) :510 — 515. /13 

119 GLASER B G, STRAUSS A L. Discovery of grounded theory; strategies for qualitative research[ M ]. New York; Aldine De Gruyter, 
1967. /15 

169 SMALL H. Cocitation in scientific literature - new measure of relationship between 2 documents | J ]. Journal of the American Society for 


236 SALTON G, WONG A, YANG C S. A vector space model for automatic indexing[ J]. Communications of the ACM,1975,18(11) ; 
613 -620. 721 
1979 321 VAN RIJSBERGEN C J. Information retrieval[ M ]. London ; Butterworths , 1979. /26 


SALTON G. Introduction to modern information retrieval| M ]. New York ; McGraw-Hill , 1983. /37 


沿 等 问题 的 研究 ;第 四 个 峰值 点 文献 是 G. Salton 发 表 
于 1975 年 的 著名 成 果 “IR 向 量 空 间 模型 "" G. Sal- 
ton 被 公认 为 是 现代 搜索 技术 之 父 ,现代 信息 检索 的 黄 
基 人 ,IR 向 量 空间 模型 成 功 地 应 用 于 了 著名 的 SMART 
文本 检索 系统 中 ;第 五 个 峰值 点 指向 的 是 C. J. Van Ri- 
jsbergen 的 专著 《Information Retrieval) "" ,C.J. Van Ri- 
jsbergen 本 人 被 公认 为 现代 信息 检索 的 创始 人 之 一 ， 
(Information Retrieval》 则 被 认为 是 信息 检索 方面 经 典 
的 教科 书 ;第 六 个 峰值 点 文献 指向 的 是 G，Salton 的 


[38] 


(Introduction to Modern Information Retrieval) — B 
为 情报 检索 提供 了 理论 的 基础 ,被 广 为 引 用 。 

3.4.3 1986 -1993 年 数字 图 书馆 领域 标准 RPYS 分 
析 从 图 2 中 可 以 发 现 ,此 时 间 段 的 图 谱 曲 线 特 点 : 
1986 年 是 个 高 峰 期 ,1987 年 处 于 相对 低谷 期 ,1988 年 
-1993 年 均 为 直线 , 即 中 位 数 为 0, 表 示 1988 年 - 
1993 年 间 每 个 RPY 的 参考 文献 总 被 引 频 次 相对 于 前 
后 5 年 内 的 中 位 数 没有 提升 也 没有 下 降 ,这 说 明 RPYS 
在 分 析 RPY 的 总 被 引 频 次 在 连续 增长 的 情况 下 是 失 
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效 的 ,但 从 图 2 中 可 以 发 现 参 考 文献 总 被 引 频次 呈现 
逐年 快速 增长 趋势 ,说 明 数 字 图 书馆 领域 的 文献 进入 
了 快速 发 展 时 期 ,为 1994 年 数字 图 书馆 领域 的 兴起 起 


到 了 推波助澜 的 作用 ,每 一 年 被 引 频 次 最 高 的 文献 仍 
是 值得 关注 的 经 典 文献 ,文献 详细 信息 如 表 3 所 示 : 


表 3 1986 -1993 年 历年 被 引 频次 最 多 的 参考 文献 


年 份 RPY 被 引 总 频次 


被 引 频 次 最 高 的 参考 文献 /被 引 频 次 


BATES M J. Subject access in online catalogs: a design model[ J ]. Journal of the Association for Information Science & Technology , 


1986 625 
1986,37(6) :357 - 376. /13 
1987 614 FURNAS G W, LANDAUER T K, GOMEZ L M, et al. The vocabulary problem in human -system communication [ J ]. Communica- 
tions of the ACM, 1987, 30(11) :964 - 971. 
1988 了 时 SALTON G, BUCKLEY G. Term-weighting approaches in automatic text retrieval[ J ]. Information processing & management ,1988 ,24 
(5) 1:513 - 523. /29 
1989 1049 DAVIS F D. Perceived usefulness, perceived ease of use, and user acceptance of information technology [ J ]. Society for Information 
Management and the Management Information Systems Research Center, 1989,13 (3) :319 — 340. /45 
1990 1 165 DEERWESTER S, DUMAIS S T, FURNAS G W, et al. Indexing by latent semantic analysis[ J]. Journal of the Association for Infor- 
mation Science & Technology ,1990 ,41 (6) :391 — 407. /24 
91 1400 KUHLTHAU C C. Inside the search process; information seeking from the user’ s perspective[ J]. Journal of the Association for Infor- 
qe mation Science & Technology ,1991 ,42(5) :361 - 371. /18 
"-— 
on 1690 GOLDBERG D. Using collaborative filtering to weave an information tapestry[ J]. Communications of the ACM,1992,35(12) :61 - 
hs 70. 
N : 
mm FOX E A, HIX D, NOWELL L T, et al. Users, user interfaces, and objects; Envision, a digital library[ J]. Journal of the American 
C^ 1993 2 189 g 
A 
P Society for Information Science , 1993 ,44(8) :480 - 491. /22 


ETA LL US 
名 外 于 信息 检索 方面 , 表 3 中 第 一 篇 是 NL I. Bates 发 
FED 1986 年 的 论文 "9 ,研究 了 如 何 构建 合适 的 查询 
(pel , 消 足 信息 检索 的 需求 ,第 二 简 是 G. W. Fumas 于 
1987 ^E. KR TE ( Communications of the ACM) Ze is E Hy 
论 交 ,讨论 了 信息 检索 的 词汇 匹配 问题 ;第 三 篇 是 
GsSalton 等 于 1988 年 发 表 的 “Term -weighting approa- 
chEgin automatic text retrieval" —H ,文章 总 结 了 关 
于 竹 动 加权 的 观点 ,并 提出 了 自动 文本 检索 的 加 权 方 
法 $ 第 四 篇 是 美国 学 者 F. D. Davis 关于 用 户 对 信息 系 
统 萎 受 的 模型 的 研究 ,其 目的 是 找 出 一 种 有 效 的 行 
为 模式 ,用 于 解释 使 用 者 对 新 的 信息 系统 接受 的 行为 ; 
第 五 篇 是 S. Deerwester 于 1990 年 建立 的 基于 语义 的 自 
动 文献 标 引 和 检索 方法 一 文中 ;第 六 篇 文献 的 作者 是 
C. C. Kuhlthau'“ 从 认 知 角度 出 发 ,解释 信息 检索 过 程 


Multi-RPYS Heatmap (Rank Transformed) 


Visualizing Referenced Publication Years by Publication Years of the Citing Documents 
m- 


就 是 一 种 认 知 过 程 , 属 于 信息 行为 学 研究 范畴 ;第 七 篇 
文献 的 作者 是 D. Goldberg ^" ,文中 最 先 提出 了 “协同 
过 滤 "概念 ,并 将 其 运用 到 Tapestry 系统 ,协同 信息 推 
荐 系统 逐渐 被 应 用 到 数字 图 书馆 领域 中 ,并 成 为 该 领 
域 的 主要 研究 主题 之 一 ;第 八 篇 是 E. Fox 的 研究 ， 
E. Fox 是 数字 图 书馆 领域 的 先驱 ,该 文献 对 数字 图 书 
馆 可 用 性 评价 进行 了 人 研究 。 
3.5 多维 RPYS 运行 结果 解读 

上 传 数 据 集 data. txt 进行 Multi -RPYS 分 析 , 图 6 
即 为 1900 - 1999 年 数字 图 书馆 领域 多 维 参考 文献 出 
版 年 图 谱 , 该 图 谱 x 轴 表 示 的 是 参考 文献 出 版 年 ,y 轴 
的 颜色 表示 每 年 参考 文献 被 引用 的 热度 值 , 热 度 值 越 
大 ,颜色 越 深 。 若 呈现 明显 连续 颜色 较 深 的 条 带 , 则 表 
明 该 年 参考 文献 在 此 期 间 被 持续 引用 , 借 此 可 进一步 


探究 该 年 被 持续 引用 的 重要 文献 。 


: . r E BE 
p onn PUEDES 
: VIRO DIG Rex 
U ] r i i , i "n "a e Ci a, m E 
= " ". di 
1900 1920 1940 1960 
Cited References E 


图 6 1900 -1999 年 数字 图 书馆 领域 多 维 参考 文献 出 版 年 图 谱 


92 


d 


RA, 谢 福 郁 , EA 


Chit 


运行 结果 页 面 下 方 呈现 的 是 可 供 检索 的 文献 列表 
( 见 图 7) ,可 以 按 出 版 年 检索 (也 可 按 作者 和 期 刊 进行 
检索 ) ,数据 内 容 是 所 检索 年 份 的 参考 文献 历年 的 被 引 
用 频次 ,该 列表 包括 6 列 内 容 , 第 一 列 为 文献 作者 ,第 


二 列 为 文献 出 版 年 ,第 三 列 为 文献 来 源 出 版 物 ,第 四 列 
为 该 文献 的 被 引 频 次 ,第 五 列 为 被 引用 年 份 , 第 六 列 为 
获取 该 文献 的 链接 。 
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Dini 
3.00 多 维 RPYS 运行 结果 分 析 


,三 从 图 6 中 可 以 发 现 ,3 个 出 版 年 有 较为 明显 的 连 
ipee t ,第 一 个 是 1945 年 出 版 的 参考 文献 在 1994 
- 2006 年 间 所 呈现 出 明显 较 深 的 条 带 ,表明 该 年 参考 
文献 在 此 期 间 被 持续 引用 。 第 二 个 是 1975 年 出 版 的 
参考 文献 在 1999 - 2004 年 .2008 - 2012 年 与 2013 - 
2017 年 间 所 呈现 出 明显 较 深 的 条 带 , 第 三 个 是 1983 年 
出 版 的 参考 文献 在 1999 - 2004 年 与 2006 -2016 年 间 
所 呈现 出 明显 较 深 的 条 带 。 

在 数据 列表 中 检索 RPY 为 1945 年 的 参考 文献 ， 
可 以 观察 到 V.， Bush 的 “As we may think" — X, TE 
1994 - 2006 年 间 , 逐 年 被 连续 引用 ,产生 了 持续 的 影响 
力 ( 见 图 7)。 

笔者 采用 同样 方法 可 以 获得 1975 年 的 参考 文献 
(IEIS), RIL G. Salton 发 表 于 1975 年 的 著名 成 果 
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续 影 响 的 论文 不 仅 这 一 篇 ,以 被 引 频次 排序 ,还 可 以 发 
现 更 多 较为 重要 的 文献 ,本 文 不 再 袭 述 。 

采用 同样 方法 获得 1983 年 的 参考 文献 ( 见 图 9) , 
发 现 G. Salton 的 《 Introduction to Modern Information 
Retrieval》(《 现 代 情 报 检索 导论 》) 一 书 在 1997 年 以 后 
的 数 年 里 均 被 多 次 引用 ,可 见 该 文 不 仅 是 对 数字 图 书 
馆 的 起 源 起 到 了 举足轻重 的 地 位 ,对 数字 图 书馆 长 期 
发 展 历 史上 也 存在 持久 的 重要 贡献 。 必 须 值得 指出 的 
是 图 6 的 右 侧 斜 坡 区 域 ,可 以 看 到 在 斜坡 的 边缘 处 颜 
色 均 较 深 , 说 明文 献 在 出 版 年 的 头 两 年 或 三 年 内 热度 
值 较 高 ,比较 容易 受到 关注 和 引用 ,呈现 出 短期 内 被 引 
用 较 频 繁 。 
3.7 研究 结论 

基于 标准 的 PPYS 与 多 维 RPYS 分 析 结 果 , 本 文 共 
发 现 了 20 篇 对 数字 图 书馆 领域 起 源 有 重要 贡献 的 文 


“IR 向 量 空间 模型 "一文 ,IR 向 量 空间 模型 作为 信息 
仿 索 中 的 最 基本 的 方法 之 一 ,在 90 年 代数 字 图 书馆 兴 
起 以 后 ,历年 都 被 诸多 文献 引用 ,当然 该 RPY 产生 持 


献 ,还 发 现 其 中 的 3 篇 文献 对 数字 图 书馆 领域 的 演化 发 
展 产 生 了 持续 影响 ,其 中 有 8 篇 文献 集中 发 表 在 《Jour- 


nal of the Association for Information Science & Technology》 


93 


Q4. xt 


$8 62 35 $8 5 Hd. 2018 5£3 H 


ChinaXiv 合 作 期 刊 


COMMUN ACM V18 


SALTON G RPY1975 


CPY2012 


CPY2015 


CPY2009 


CPY2010 


CPY1998 


CPY2006 


CPY2013 


CPY2002 


CPY2008 


CPY2011 


CPY2000 


CPY2014 


CPY2001 


CPY2016 


8 1975 年 参考 文献 历年 被 引用 频次 检索 结果 


Link 


CPY2003 


CPY1997 


CPY2000 


CPY1999 


CPY2010 


CPY2008 


CPY2004 


CPY2001 


CPY2002 


CPY2001 
CPY2002 


P613 
SALTON G RPY1975 COMMUN ACM V18 3 
P613 
SALTON G RPY1975 COMMUN ACM V18 „ 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
P613 
SALTON G RPY1975 COMMUN ACM V18 
THEORY OF 
> SALTON G RPY1975 THEORY C 
© Search and Refine Results: rpy1983 
" 
INTRO MODERN 
©O Pona REKI INFORMA 
INTRO MODERN 
这 ipea: R INFORMA 
INTRO MODERN 
O ius REVINSS INFORMA 
INTRO MODERN 
CN SALTON G RPY1983 od Pd 
"m 
INTRO MODERN 
> SALTON G. RPY1983 olla 
E mE 
INTRO MODERN 
>< rs REY IS83 INFORM 
INTRO MODERN 
E paoe REVR INFORMA 
VISUAL DISPLAY 
a TUFTE E. RPY1983 AKT 
- INTRO MODERN 
- SALTON G RPY1983 INFORMA 
INTRO MODERN 
EUER RPYIS83 INFORMA 
SMEATON AF RPY1983 COMPUT J V26 P239 
INTRO MODERN 
EE REVISSS INFORMA 


CPY2005 


9 1983 年 参考 文献 历年 被 引用 频次 检索 结果 


(Journal of the Association for Information Science & 
Technology) (Journal of the American Society for Informa- 
tion Science) 3 3 种 期 刊 上 ,可 见 这 3 种 期 刊 对 数字 图 
书馆 领域 的 起 源 较为 重要 ,其 中 有 3 篇 文献 均 为 同一 
EŻ G. Salton, ESK F G. Salton 对 数字 图 书馆 领域 起 
源 及 发 展 的 重要 地 位 。 结 合 国内 外 数字 图 书馆 领域 的 
综述 文章 ,笔者 对 数字 图 书馆 起 源 的 演化 过 程 有 了 新 
的 认识 ,并 将 其 定义 为 3 个 阶段 :第 一 个 阶段 是 幻想 时 
期 (1913 — 1960 年 ),H. Ebbinghaus,G. A. Mille 指出 
了 短 时 记忆 的 局 限 ,H. G. Wells Ej V. Bush 对 可 进行 
长 期 大 量 存 储 并 易于 获取 的 系统 或 设备 进行 了 想象 。 
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第 二 个 阶段 是 莫 基 时 期 (1961 - 1985 4E) ,该 时 期 积累 
了 一 些 信息 检索 和 科学 计量 的 基础 研究 ,为 数字 图 书 
馆 领 域 的 萌芽 黄 定 了 基础 。 如 D. J.D. PRICE 1965 年 
一 文 和 再 Small 1973 年 一 文 均 为 科学 计量 史上 的 著 
名 论文 ,G. Salton 提出 的 IR 向 量 模型 是 文本 检索 系统 
的 基础 , C. J. Van Rijsbergen1979 年 一 书 和 G. Sal- 
ton1983 年 一 书 是 信息 检索 领域 的 经 典 教材 。 第 三 个 
阶段 是 发 展 时 期 (1986 - 1994 年 ) ,该 时 间 段 仍 集中 于 
言 息 检索 方向 ,但 研究 的 问题 更 加 细 化 和 深入 ,推动 了 
数字 图 书馆 领域 快速 兴起 ,例如 M. J. Bates 讨论 了 如 
何 建 立 查 询 模 型 ,G. W. Fumas 讨论 了 信息 检索 的 词 
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汇 匹 配 问题 ,G，Salton 提出 了 自动 文本 检索 的 加 权 方 
法 ,$. Deerwester 建立 了 基于 语义 的 自动 文献 标 引 和 
检索 方法 ,此 阶段 的 研究 还 倾向 于 人 研究 数字 图 书馆 与 
用 户 交互 问题 ,该 问题 后 续 也 被 研究 者 尤为 关注 , 广 为 
研究 。 综 上 所 述 ,通过 分 析 对 数字 图 书馆 领域 产生 前 
的 重要 起 源 文 献 和 演化 过 程 有 了 新 的 发 现 ,这 是 很 多 
综述 文献 都 未 做 到 的 。 


本 文 利用 可 视 化 工具 RPYS io, 探 索 并 发 现 对 数 
字 图 书馆 领域 的 起 源 和 演化 起 到 重要 影响 的 文献 ,该 
方法 能 够 较 准 确 地 发 现 该 领域 起 源 相关 的 经 典 文献 ， 
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Abstract. [ Purpose/significance | This article aims to explore seminal works about the historical roots of a specific 


research field or subject. The study of historical roots is of great significance for the construction and research. [ Method/ 


process | We describe a technical advancement for developing research historiographies by introducing RPYS i/o, an on- 


line tool for performing standard RPYS and multi -RPYS analyses. Based on RPYS i/o, we take digital library research 


field as an example. [ Result/conclusion | The tool enables users to explore seminal works underlying a research field and 


to plot the influence of these seminal works over time. 
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